Visualisering af Flora Danicas rensede metadataset#
Før du starter#
Før du begynder at køre dette script på din egen computer, skal du bemærke, at scriptet bruger følgende biblioteker, som ikke er en del af standardpakkerne. Du kan installere dem fra din notebook ved hjælp af pip install. Opret en ny celle og kør følgende:
!pip install matplotlib plotly-express
# Import af biblioteker
import pandas as pd
import plotly.express as px
# Indlæs det rensede datasæt
subset_df = pd.read_csv(r'.\mekuni_flora_danica_data\flora_danica_tidy_format.csv')
# Count and plot authors
author_data_in = subset_df['author_st'].value_counts().to_frame().reset_index()
fig = px.bar(author_data_in, x='author_st', y='count',
color_discrete_sequence=["#13dbb7"],
title='Forfattere og antal af udgivne tavler')
# Update layout for better readability
fig.update_layout(
xaxis_title='Authors',
yaxis_title='Count',
xaxis_tickangle=-45, # Rotate x-axis labels for better readability
yaxis=dict(showgrid=True, gridcolor="#45d6d3", gridwidth=0.5), # Add gridlines
plot_bgcolor='white' # Set the background color to white
)
fig.show()
taxonomy_data_in = subset_df['taxonomic_group_st'].value_counts().to_frame().reset_index()
taxonomy_data_in = taxonomy_data_in.query('count > 15')
# Brug Plotly til at lave et diagram
fig = px.bar(taxonomy_data_in,x='taxonomic_group_st', y='count',
color_discrete_sequence=["#ea7600"],
title='Plante grupper')
# Tilpas layout for at forbedre læsevenligheden
fig.update_layout(
xaxis_title='Taxonomisk gruppe',
yaxis_title='Sum',
xaxis_tickangle=-45, # Rotate labels på x-akserne
yaxis=dict(showgrid=True, gridcolor="#45d6d3", gridwidth=0.5), # Til linjemønster
plot_bgcolor='white' # Sæt backgrundsfarven til hvid
)
fig.show()
print ('Gør data klar til visualisering; group data by "Latinsk familienavn" og tæl værdierne i "Latinsk navn"')
count_df = subset_df.groupby('latin_family_name')['latin_name'].value_counts().to_frame()\
.query('count >= 1').reset_index()
# Byg et interaktivt "træ" diagram med plotly
fig = px.treemap(count_df, path=['latin_family_name', 'latin_name'], values='count',
color_discrete_sequence=["#45d6d3", "#2224ba", "#ee138c", "#ea7600", "#13dbb7"],
title='Tree Visualization of Plant Families and Species')
# Vis figuren
fig.show()
Gør data klar til visualisering; group data by "Latinsk familienavn" og tæl værdierne i "Latinsk navn"
print('Tæl værdierne i kolonnen "Latinsk familienavn".')
family_names_value_count = subset_df['latin_family_name'].value_counts().reset_index()
print ('Vælg de første 25 rækker ud til visualisering.')
plot_df = family_names_value_count.head(25).copy()
# lav et interaktivt sølje diagram med Plotly
fig = px.bar(plot_df,
x='latin_family_name',
y='count',
title='Forskellige plantefamilier',
labels={'latin_family_name': 'Latinsk Familienavn', 'count': 'Count'},
color_discrete_sequence=['#ee138c'])
# Tilpas layout, så det er mere læsbart
fig.update_layout(
xaxis_title='Latinsk Familienavn',
yaxis_title='Sum',
xaxis_tickangle=-45, # Roter labels på x-aksen
yaxis=dict(showgrid=True, gridcolor="#45d6d3", gridwidth=0.5), # Tilføj linjer
plot_bgcolor='white' # Baggrundsfarve bliver hvid
)
# Vis diagrammet
fig.show()
Tæl værdierne i kolonnen "Latinsk familienavn".
Vælg de første 25 rækker ud til visualisering.